Préparation

Créez un dossier de travail dans lequel vous placerez le fichier csv ainsi que le fichier py. Téléchargez le fichier CSV en le renommant "villes_virgule.csv" et ouvrez le avec NodePad++ (ou un autre éditeur de texte).

1. Combien de villes sont répertoriées ?

2. Donnez la surface et la population de Paris en 2012.

3. Ouvrez ce fichier avec un tableur tel que Excel ou Libre office Calc (jeu de caractère unicode utf-8) de manière à visualiser et travailler sur les différentes colonnes.

  • Sur Excel, sélectionnez toute la colonne, puis "Données" et "Convertir" puis choisissez la virgule comme séparateur (vérifiez dans les options avancées du format que le point décimal soit sélectionné). Voir vidéo "excel_csv"
  • Sur Libre office Calc, sélectionnez la langue anglaise et la virgule comme séparateur.

4. Triez le tableau par densité de population de la moins forte à la plus forte. Combien de villes ont une densité supérieure à 10 000 habitants par kilomètre carré ?

Pour traiter des données, nous allons utiliser la bibliothèque Python Pandas qui permet la manipulation et l'analyse des données. On donne :

import pandas
villes = pandas.read_csv("villes_virgule.csv") #L’objet « villes » contient le fichier

Il est possible de récupérer certaines données du tableau, par exemple, certaines lignes, certaines colonnes ou bien encore des valeurs uniques. Pour cela, il suffit d'utiliser la méthode « loc » avec les index des lignes et les index des colonnes. Le principe de fonctionnement de « loc » est relativement simple puisque l'on aura une instruction de la forme « villes.loc[index_ligne, index_colonne] ».
On peut aussi récupérer toutes les lignes d’une colonne « villes.loc[:, index_colonne] » ou toutes les colonnes d’une ligne « villes.loc[index_ligne, :] ». Index_ligne ou index_colonne peut prendre la forme d’un numéro ou d’un test.

Exemple :
print(villes.loc[villes["nom"]=="Paris", ["dens"]])
print("************************")
print(villes.loc[30437, :])

La méthode mean() permet de calculer une moyenne. On l’utilise avec « villes.loc[index_ligne, index_colonne].mean() »

Source : https://lesmanuelslibres.region-academique-idf.fr
Télécharger le manuel : https://forge.apps.education.fr/drane-ile-de-france/les-manuels-libres/snt-seconde ou directement le fichier ZIP
Sous réserve des droits de propriété intellectuelle de tiers, les contenus de ce site sont proposés dans le cadre du droit Français sous licence CC BY-NC-SA 4.0